Test basic
Published:
Data science와 statistics에서는 빠지지 않고 나오는 이야기 A/B TEST, Hypothesis, Critical Value alpha, t-test, p-value, p-hacking에 대해서 알아보도록 하겠습니다.
Content
- A/B TEST란?
- Hypothesis?
- Critical Value alpha($\alpha$) ?
- t-test
- p-value
- p-hacking
1. What is A/B Test
의미
- 시스템 방문자를 임의로 두 집단으로 나눈다.
- 한 집단에게는 기존 사이트를 보여준다
- 다른 집단에게는 새로운 사이트를 보여준다.
- 두 집단 중 어떠한 집단이 더 높은 만족을 나타내는지 측정하여, 정량적으로 평가한다.
목적
복수의 상황에 대한 고객 반응을 테스트하여 최적의 방안을 식별한다.
사례
오바마 캠프 와 같이 실제로 투표율을 높임으로써 현실세계에서 잘 쓰이는 기법 중 하나
So.. what is A/B test
A = B 이느냐를 확인함으로써 차이가 있다/없다
를 계속 상황을 변경시키는 것을 의미
2. Hypothesis
앞에서 보았던 A/B test에서 차이가 있다/없다
를 본다는 것임을 일수 있다. 여기서 A의 영향을 $p_A$, B의 영향을 $p_B$라고 하고, null hypothesis(귀무가설)을 $H_o$ , alternative hypothesis(대립가설)을 $H_1$이라고 한다면,
$H_0 : d = p_A - p_B = 0$ $H_1 : d = p_A - p_B >0$
위와 같이 차이가 없다를 null hypothesis 차이가 조금이라도 있다를 alternative hypothesis이라고 한다.
Type I & II Error
- Type I Error: 1종 오류, 귀무가설이 사실인데 기각할 오류 => 즉 효과가 없는데 있다고 할 오류
- Type II Error: 2종 오류, 귀무가설이 거짓인데 기각하지 않을 오류 => 효과가 있는데 없다고 할 오류
3. 임계치(Critical Value alpha)
현실세계에서 Type I Error 와 Type II Error 중에서 어느쪽에 무게를 더 실을지를 정해야한다.
<참고 blog=""> [http://blog.naver.com/PostView.nhn?blogId=leerider&logNo=100189538379&parentCategoryNo=&categoryNo=59&viewDate=&isShowPopularPosts=true&from=search](http://blog.naver.com/PostView.nhn?blogId=leerider&logNo=100189538379&parentCategoryNo=&categoryNo=59&viewDate=&isShowPopularPosts=true&from=search) [https://boxnwhis.kr/2016/04/15/dont_be_overwhelmed_by_pvalue.html](https://boxnwhis.kr/2016/04/15/dont_be_overwhelmed_by_pvalue.html) 참고>